智能论文笔记

Active Learning-based Isolation Forest (ALIF): Enhancing Anomaly Detection in Decision Support Systems

Elisa Marcelli , Tommaso Barbariol , Gian Antonio Susto

分类：机器学习 | 人工智能

2022-07-08

在许多应用程序中，检测异常行为是新兴的需求，尤其是在安全性和可靠性是关键方面的情况下。尽管对异常的定义严格取决于域框架，但它通常是不切实际的或太耗时的，无法获得完全标记的数据集。使用无监督模型来克服缺乏标签的模型通常无法捕获特定的特定异常情况，因为它们依赖于异常值的一般定义。本文提出了一种新的基于积极学习的方法Alif，以通过减少所需标签的数量并将检测器调整为用户提供的异常的定义来解决此问题。在存在决策支持系统（DSS）的情况下，提出的方法特别有吸引力，这种情况在现实世界中越来越流行。尽管常见的DSS嵌入异常检测功能取决于无监督的模型，但它们没有办法提高性能：Alif能够通过在常见操作期间利用用户反馈来增强DSS的功能。 Alif是对流行的隔离森林的轻巧修改，在许多真实的异常检测数据集中，相对于其他最先进的算法证明了相对于其他最先进算法的出色性能。

translated by 谷歌翻译

A soft nearest-neighbor framework for continual semi-supervised learning

Zhiqi Kang , Enrico Fini , Moin Nabi , Elisa Ricci , Karteek Alahari

分类：计算机视觉 | 机器学习

2022-12-09

Despite significant advances, the performance of state-of-the-art continual learning approaches hinges on the unrealistic scenario of fully labeled data. In this paper, we tackle this challenge and propose an approach for continual semi-supervised learning -- a setting where not all the data samples are labeled. An underlying issue in this scenario is the model forgetting representations of unlabeled data and overfitting the labeled ones. We leverage the power of nearest-neighbor classifiers to non-linearly partition the feature space and learn a strong representation for the current task, as well as distill relevant information from previous tasks. We perform a thorough experimental evaluation and show that our method outperforms all the existing approaches by large margins, setting a strong state of the art on the continual semi-supervised learning paradigm. For example, on CIFAR100 we surpass several others even when using at least 30 times less supervision (0.8% vs. 25% of annotations).

translated by 谷歌翻译

A Deep Learning Approach to the Prediction of Drug Side-Effects on Molecular Graphs

Pietro Bongini , Elisa Messori , Niccolò Pancino , Monica Bianchini

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-11-30

Predicting drug side-effects before they occur is a key task in keeping the number of drug-related hospitalizations low and to improve drug discovery processes. Automatic predictors of side-effects generally are not able to process the structure of the drug, resulting in a loss of information. Graph neural networks have seen great success in recent years, thanks to their ability of exploiting the information conveyed by the graph structure and labels. These models have been used in a wide variety of biological applications, among which the prediction of drug side-effects on a large knowledge graph. Exploiting the molecular graph encoding the structure of the drug represents a novel approach, in which the problem is formulated as a multi-class multi-label graph-focused classification. We developed a methodology to carry out this task, using recurrent Graph Neural Networks, and building a dataset from freely accessible and well established data sources. The results show that our method has an improved classification capability, under many parameters and metrics, with respect to previously available predictors.

translated by 谷歌翻译

A Few Shot Multi-Representation Approach for N-gram Spotting in Historical Manuscripts

Giuseppe De Gregorio , Sanket Biswas , Mohamed Ali Souibgui , Asma Bensalah , Josep Lladós , Alicia Fornés , Angelo Marcelli

分类：计算机视觉

2022-09-21

尽管最近的自动文本识别取得了进步，但在历史手稿方面，该性能仍然保持温和。这主要是因为缺乏可用的标记数据来训练渴望数据的手写文本识别（HTR）模型。由于错误率的降低，关键字发现系统（KWS）提供了HTR的有效替代方案，但通常仅限于封闭的参考词汇。在本文中，我们提出了一些学习范式，用于发现几个字符（n-gram）的序列，这些序列需要少量标记的训练数据。我们表明，对重要的n-gram的认识可以减少系统对词汇的依赖。在这种情况下，输入手写线图像中的vocabulary（OOV）单词可能是属于词典的n-gram序列。对我们提出的多代表方法进行了广泛的实验评估。

translated by 谷歌翻译

Multimodal Across Domains Gaze Target Detection

Francesco Tonini , Cigdem Beyan , Elisa Ricci

分类：计算机视觉 | 人工智能

2022-08-23

本文解决了从第三人称角度捕获的单个图像中的目光目标检测问题。我们提出了一个多模式的深度建筑，以推断一个人在场景中所处的位置。该空间模型经过了代表丰富上下文信息的感兴趣人，场景和深度图的头部图像训练。我们的模型与几种先前的艺术不同，不需要对目光角度的监督，不依赖头部方向信息和/或利益人眼睛的位置。广泛的实验证明了我们方法在多个基准数据集上的性能更强。我们还通过改变多模式数据的联合学习来研究我们方法的几种变体。一些变化的表现也胜过一些先前的艺术。首次在本文中，我们检查了域名的凝视目标检测，并授权多模式网络有效地处理跨数据集的域间隙。该方法的代码可在https://github.com/francescotonini/multimodal-across-domains-domains-domains-domains-domains-warget-detection上获得。

translated by 谷歌翻译

Uncertainty-guided Source-free Domain Adaptation

Subhankar Roy , Martin Trapp , Andrea Pilzer , Juho Kannala , Nicu Sebe , Elisa Ricci , Arno Solin

分类：计算机视觉 | 机器学习

2022-08-16

无源域的适应性（SFDA）旨在通过仅使用预训练的源模型将分类器调整为未标记的目标数据集。但是，缺乏源数据和域移动使目标数据对目标数据的预测不可靠。我们建议量化源模型预测中的不确定性，并利用它来指导目标适应。为此，我们通过在网络参数上合并先验，构建一个概率源模型，从而在模型预测上诱导分布。通过采用拉普拉斯近似值来估算不确定性，并合并以识别不在源歧管中的目标数据点并在最大化目标数据上的共同信息时减少重量。与最近的作品不同，我们的概率处理是计算轻量级，脱离源训练和目标适应，并且不需要专门的源培训或模型体系结构的更改。我们显示了不确定性引导的SFDA比封闭设置和开放式设置中的传统SFDA的优势，并提供了经验证据，即即使没有调整，我们的方法对于强大的域转移也更为强大。

translated by 谷歌翻译

UniRank: Unimodal Bandit Algorithm for Online Ranking

Camille-Sovanneary Gauthier , Romaric Gaudel , Elisa Fromont

分类：机器学习

2022-08-02

我们解决了一个新的新兴问题，该问题正在加权图中找到最佳的单核匹配。\ cite {adma}在每次迭代中采样完整匹配的半频带版本，创建了一个算法，预期的遗憾匹配$ o（\ frac {l \ log（l）} {\ delta {\ delta} \ log（t））$带$ 2L $播放器，$ t $迭代和最小奖励差距$ \ delta $。我们分两个步骤减少了这一界限。首先，如\ cite {grab}和\ cite {unirank}，我们在适当的图上使用预期奖励的无模式属性来设计算法，并遗憾地在$ o（l \ frac {1} {\ delta} {\ delta} \ \log（t））$。其次，我们表明，通过将焦点转移到主要问题`\ emph {用户$ i $比用户$ j $更好？}'这个遗憾变成$ O（l \ frac {\ delta}}^2} \ log（t））$，其中$ \ tilde {\ delta}> \ delta $源自比较用户的更好方法。一些实验结果最终表明这些理论结果在实践中得到了证实。

translated by 谷歌翻译

iCub Being Social: Exploiting Social Cues for Interactive Object Detection Learning

Maria Lombardi , Elisa Maiettini , Vadim Tikhanoff , Lorenzo Natale

分类：机器人

2022-07-27

执行联合互动需要持续相互监测自己的动作及其对对方行为的影响。这种行动效应的监测受到社会提示的提高，并可能导致越来越多的代理意识。共同行动和联合注意力严格相关，两者都有助于形成精确的时间协调。在人类机器人的互动中，机器人能够与人类伴侣建立共同关注并利用各种社会提示进行反应的能力是创建交流机器人的关键步骤。沿着社会组成部分，可以将有效的人类机器人互动视为改进和使机器人的学习过程更自然和健壮的新方法。在这项工作中，我们使用不同的社交技能，例如相互视线，凝视跟随，言语和人的面部识别，以开发有效的教师学习者场景，适用于动态环境中的视觉对象学习。 ICUB机器人的实验表明，该系统允许机器人通过与人类老师的自然互动来学习新对象，并在存在分心者的情况下学习。

translated by 谷歌翻译

Unsupervised Domain Adaptation for Video Transformers in Action Recognition

Victor G. Turrisi da Costa , Giacomo Zara , Paolo Rota , Thiago Oliveira-Santos , Nicu Sebe , Vittorio Murino , Elisa Ricci

分类：计算机视觉

2022-07-26

在过去的几年中，无监督的域适应性（UDA）技术在计算机视觉中具有显着的重要性和流行。但是，与可用于图像的广泛文献相比，视频领域仍然相对尚未探索。另一方面，动作识别模型的性能受到域转移的严重影响。在本文中，我们提出了一种简单新颖的UDA方法，以供视频动作识别。我们的方法利用了时空变压器的最新进展来构建一个强大的源模型，从而更好地概括了目标域。此外，由于引入了来自信息瓶颈原则的新颖对齐损失术语，我们的架构将学习域不变功能。我们报告了UDA的两个视频动作识别基准的结果，显示了HMDB $ \ leftrightArrow $ ucf的最新性能，以及动力学$ \ rightarrow $ nec-Drone，这更具挑战性。这证明了我们方法在处理不同级别的域转移方面的有效性。源代码可在https://github.com/vturrisi/udavt上获得。

translated by 谷歌翻译

Multimodal Emotion Recognition with Modality-Pairwise Unsupervised Contrastive Loss

Riccardo Franceschini , Enrico Fini , Cigdem Beyan , Alessandro Conti , Federica Arrigoni , Elisa Ricci

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-23

情绪识别涉及几个现实世界应用。随着可用方式的增加，对情绪的自动理解正在更准确地进行。多模式情感识别（MER）的成功主要依赖于监督的学习范式。但是，数据注释昂贵，耗时，并且由于情绪表达和感知取决于几个因素（例如，年龄，性别，文化），获得具有高可靠性的标签很难。由这些动机，我们专注于MER的无监督功能学习。我们考虑使用离散的情绪，并用作模式文本，音频和视觉。我们的方法是基于成对方式之间的对比损失，是MER文献中的第一次尝试。与现有的MER方法相比，我们的端到端特征学习方法具有几种差异（和优势）：i）无监督，因此学习缺乏数据标记成本； ii）它不需要数据空间增强，模态对准，大量批量大小或时期； iii）它仅在推理时应用数据融合； iv）它不需要对情绪识别任务进行预训练的骨干。基准数据集上的实验表明，我们的方法优于MER中应用的几种基线方法和无监督的学习方法。特别是，它甚至超过了一些有监督的MER最先进的。

translated by 谷歌翻译